

from lxml import etree

html_str = """
    
    <ul>
        <li>
            <a>a2</a>
        </li>
        <li>
            <a>a2</a>
        </li>
        <li>
            <a>a2</a>
        </li>
    </ul>
    
 """

# 解析的时候 面向的标签对象
# 如果你获取的 第一级标签 用了 text().; @href 类型就变了
data = etree.HTML(html_str)
li_list = data.xpath('//li')
print(li_list)
# 二级解析
# for li  in li_list:
#     a = li.xpath('./a/text()')
#     print(a)
